苹果在第15个全球无障碍意识日发布了全新辅助功能,融合Apple Intelligence技术,提升残障人士在iPhone、Mac和Vision Pro上的体验。VoiceOver功能升级,新增图像资源管理器,视障用户可通过AI识别图像内容,实现更便捷的视觉辅助。
Claude Code推出语音模式,开发者可通过自然语音下达指令,告别纯键盘输入,提升编程效率。该功能已逐步推送,用户只需输入/voice命令即可开启。
声网联合美团等发布AI外呼评测基准VoiceAgentEval,强调实战性,覆盖6大领域30个子场景,旨在用真实业务数据推动行业标准化发展。
AI音频公司ElevenLabs与奥斯卡得主Matthew McConaughey、Michael Caine达成语音克隆合作,将其AI声线纳入新平台“Iconic Voice Marketplace”。该平台已收录超25位名人语音,提供合法授权使用渠道。McConaughey作为公司投资人,将利用自身声音参与项目。
VoiceDash是AI语音打字工具,可速将语音转为结构化文本,提升生产力。
24/7 AI前台语音代理,实时接听、筛选来电、预约会议并同步CRM
Voiceslab可免费即时创建AI语音,通过语音克隆保留音色与口音。
Voiceley可免费快速进行AI语音克隆,还能使用语音模型生成语音。
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
UsefulSensors
Moonshine Tiny是由Moonshine AI(原有用传感器公司)开发的轻量级越南语自动语音识别模型,仅有27M参数,专为资源受限平台设计,在Fleurs和Common Voice 17数据集上表现出色。
webbigdata
VoiceCore是一款可商用的日语语音AI代理模型,专注于让AI通过语音与人类进行自然交流,具备情感表达和非语言声音能力,支持多种语音风格选择。
Voice Mode是一个为AI助手提供自然语音对话功能的工具,支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。
一个Node.js客户端,用于集成远程MCP服务器,为Voiceflow代理提供工具支持,支持多种工具发现和Claude AI集成。
Voicevox MCP Server是一个VOICEVOX兼容的语音合成服务器,通过MCP协议实现与AivisSpeech/VOICEVOX/COEIROINK的交互,支持Cursor等编辑器中的Claude 3.7代理模式语音合成。